Dense Vector
GPT-4.icon
概要
すべての次元に実数値が存在するベクトル。
一般に次元数は数百〜数千程度(例:512次元, 768次元など)。
**ディープラーニングや埋め込み(embedding)**によって生成されることが多い。
具体例
たとえば、[0.12, -0.34, 0.91, ..., -0.08](全ての要素に値がある)
使われ方
意味的な類似性の検索に使われる(例:文章や画像の類似検索)。
コサイン類似度やユークリッド距離で比較される。
使用例:OpenAI Embedding, sentence-transformers, FAISS, Qdrant など。
メリット
意味的な情報を圧縮して表現できる。
モダンな検索(semantic search)に向いている。
デメリット
インタープリタビリティ(可読性)が低い(どの次元が何を意味しているか不明)。
計算量が多いため、高速検索には専用の近似アルゴリズムが必要(例:ANN)。